搜索资源列表
classifier-1.12
- 能对从Google中搜索出来的文本进行聚类,提供了Java包,及调用源代码.-can right from the Google Search for the text clustering, a Java package, source code and call.
clusty.tar
- 聚类分析的文本组合 压缩文件用于聚类分析的数据处理-cluster analysis of the text composition compressed files for Cluster Analysis of Data Processing
kmeansjulei
- 这是用VC++编写的K_means 聚类算法的程序,详细的运行说明在文件夹的文本说明里!-This is the preparation of the VC K_means clustering algorithm procedures, a detailed statement of the operation folder notes to the text!
wenbenwajue1232
- 关于文本挖掘的摘要,对各种聚类算法进行了分析,是个好的东西-on Text Mining summary of the various clustering algorithms to the analysis is a good thing
2007Z
- 语义平滑文件模式聚类,代表了文本挖掘的前沿技术,和热门方向(英语原版)-semantic document clustering model, the representative of the Text Mining of advanced technology, and popular direction (English original)
HLSSplit.RAR
- 关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤
SurveyTextMining
- 这是一本关于文本挖掘的书籍,包括聚类 分类 信息提取的内容
KMEANSII
- 神经网络中的K均值聚类算法II: 1.KMIn为输入数据文本,其中,第一个参数为所要聚类点个数,第二个参数为聚类点的维数,第三个参数为所要求聚类的个数 2.KM2OUT为经过K均值聚类算法II计算后得到的结果
LHY
- 文本统计与识别的代码 用到了聚类的算法 是统计课程的大作业
GetFileTimes
- 用java编写的tf*idf 结果输出txt文本,方便作后来的聚类矩阵
cluster_algorithm
- 包括分解聚类算法和k-均值聚类算法,内有用到的数据文本文件,开发环境Visual Studio .NET2003
the_application_of_clustering
- 这是一篇讲述聚类在文本挖掘中的应用的博士论文,个人认为讲述的还是比较细的.
VSM
- 用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成。
FCM的一种实现方法
- 请运行程序,并在程序所在文件夹下面创建文本文件:datain.txt和paramOut.txt,文件的详细说明见下面。程序的运行没有可视的界面,运行完毕之后会在该文件夹下面产生center.txt和matrix.txt两个文件,其中center.txt为聚类的中心,matrix.txt为隶属度矩阵。在运行本程序之前,先参考一下FCM聚类算法介绍.doc
vsm
- 用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成
vsm
- 向量空间模型生成算法 文本挖掘的关键步骤就是对所给文档生成向量空间模型,然后对进行段落聚类-vsm generation algorithm text mining is a key step to the right documents generated by the vector space model, then right for paragraphs Clustering
Kmeans
- 基于opencv的kmeans聚类实现 输入文本数据,进行聚类输出-Opencv-based clustering of kmeans the input text data, clustering output
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
program
- 基于无监督学习的谱聚类算法的文本的聚类分类。-Unsupervised Learning Based on spectral clustering algorithm for text clustering classification.
协同过滤算法
- 文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。(Text clustering document clustering is based on the well-known clustering assum